삼성 엑시노스/2000 시리즈
덤프버전 : (♥ 0)
||
삼성전자 시스템 LSI 사업부가 2020년부터 운영하기 시작한 모바일 AP 브랜드 삼성 엑시노스의 플래그십 라인업이다.
2020년에 출시된 엑시노스 990을 마지막으로 네이밍 자체가 변경이 필요하게 되었고, Exynos M계열 CPU의 실패로 인해 삼성 S.LSI 내의 SARC Team이 아닌 ARM Cortex CPU 기반으로 선회하게 된 시리즈이다.[1]
기존의 엑시노스 900 시리즈의 플래그십 라인업의 후신이다.
네이밍 방식은 출시연도의 마지막 두 자리 ×100 이다. 일반적으로 산 이름을 코드네임으로 사용한다.
||1. 개요[편집]
삼성전자 시스템 LSI 사업부가 2020년부터 운영하기 시작한 모바일 AP 브랜드 삼성 엑시노스의 플래그십 라인업이다.
2. 상세[편집]
2020년에 출시된 엑시노스 990을 마지막으로 네이밍 자체가 변경이 필요하게 되었고, Exynos M계열 CPU의 실패로 인해 삼성 S.LSI 내의 SARC Team이 아닌 ARM Cortex CPU 기반으로 선회하게 된 시리즈이다.[1]
기존의 엑시노스 900 시리즈의 플래그십 라인업의 후신이다.
2.1. 제품 목록[편집]
네이밍 방식은 출시연도의 마지막 두 자리 ×100 이다. 일반적으로 산 이름을 코드네임으로 사용한다.
2.1.1. 엑시노스 2100 / S5E9840[편집]
[ 자세히 보기 ]
2.1.1.1. 개요[편집]
2021년 1월 12일에 공개된 모바일 AP로, 엑시노스 990 (S5E9830)의 후속작이다. 코드네임은 올림포스(Olympus)로 전작과 달리 다시 산 이름으로 돌아왔다. 공개 연도인 2021년에 맞춰 '엑시노스 2100'로 명명되었다.
2.1.1.2. 상세[편집]
CPU는 ARM Cortex-X1을 싱글코어 구성으로 빅 클러스터를 이루고, ARM Cortex-A78를 트리플 코어 구성으로 미들 클러스터를 이루고, ARM Cortex-A55를 쿼드코어 구성으로 리틀 클러스터로 이뤄서 ARM big.LITTLE 솔루션을 적용한 DynamIQ 방식 HMP 모드 지원 옥타코어 CPU를 탑재했다.
GPU는 ARM Mali-G78을 14코어 구성으로 탑재했다.
NPU는 삼성전자 독자설계 아키텍쳐를 트리플코어 구성으로 탑재하였다. CPU, GPU 그리고 DSP를 같이 연계해서 AI 성능을 처리하며 최대 26 TOPS의 성능을 가진다고 한다.
메모리 컨트롤러도 탑재해서 LPDDR5 SDRAM, UFS 3.1, eMMC x.x을 지원한다. 또한, 통신 모뎀 솔루션을 내장해서 다운로드 최대 속도 규격으로 xx를 지원해 최대 x Gbps의 속도를 보장한다.
삼성전자 파운드리 사업부의 5nm FinFET E 공정이다.[2]
2.1.1.3. 성능 분석[편집]
[ SPEC 2006 기준 CPU 성능 및 전력효율 데이터 ]
SPEC2006 기준으로 엑시노스 2100의 Cortex-X1은 스냅드래곤의 동일 코어와 비교시 70.4 MHz 더 높은 클럭으로 세팅되어 있으면서도 오히려 IPC는 소폭 낮고, 전력소모는 더 높다. 그러나 990이 스냅드래곤 865와 비교당하던 때, 혹은 역으로 스냅드래곤 810이 5433과 비교당할 때처럼 전력효율 격차가 2배 가까이 벌어지던 상황까지는 아니다. 미들코어인 Cortex-A78은 클럭 자체가 더 높게 세팅되어 있기 때문에 성능 또한 더 높지만, 전력효율 면에서 X1 이상의 트레이드-오프가 존재하였던 것으로 보인다. Geekbench 5 기준으로는 싱글코어 성능 1100점대, 그리고 멀티코어 성능은 최대치로는 4000점대의 점수까지 포착이 되지만, 냉동실 벤치나 혹은 상위 5% 내외의 수율의 칩이 아니라면 일반적인 사용 환경 내에서는 약 3400~3600점 내외[3] 로 측정이 되고 있다.
[ PCMark 2.0 기준 실제 UX 성능 및 전력효율 데이터 ]
PCMark 2.0 기준으로는 엑시노스 2100의 더 높은 미들코어 성능과 빠릿해진 스케쥴러 덕분에 그동안 열세였던 UX 성능 측면에서 스냅드래곤 시리즈와 역전을 하는데 성공한다. 총점 기준으로 14000점을 찍어주는데, 그 이전 Exynos M3~M5가 각각 5천점, 9천점, 1만점 수준에서 머물던 것을 감안하면 ARM 레퍼런스 IP를 활용하면서 확실한 이득을 취한 것으로 보여진다. 물론 첫번째 사진의 표와 위의 SPEC 전력 효율 데이터에서 볼 수 있듯이, 이는 전력 효율 면에서의 트레이드-오프가 이뤄진 결과이며 당연히 배터리 사용 시간 측면에서는 열세 구도를 가지게 되었다.
[ GFXBench 기준 API별 그래픽 성능 및 전력효율 데이터 ]
GFXBench 기준으로 N5 공정에서 양산된 하이실리콘의 기린 9000과 비교시에는 엑시노스 2100의 Mali-G78이 기린 9000의 G78과 비교시 저코어, 고클럭 구조를 취하였고, 공정상으로도 열세이기 때문에 전력효율 면에서 상당히 손해를 보는 상황이다. 양측 모두 5LPE에서 양산되었으며, 고클럭으로 구동이 되는 스냅드래곤 888의 Adreno와 비교시에도 Peak 성능을 유지할 때의 전성비는 서로 비슷한 수준이지만, 양측 모두 쓰로틀링이 걸려서 3W 수준으로 유지될때에는 퀄컴 Adreno와의 전성비 격차가 크게 벌어지는 것을 알 수 있다. 스냅드래곤 865와 비교시에는 처음에는 더 앞서는 성능을 보여주나, 장기적으로는 865가 더 꾸준히 성능을 유지하는 것을 볼 수 있다.
GFXBench상에서는 888과 비교시 저조한 전력효율을 보여주나, 3DMark 상에서는 Sustained Performance 비율 및 성능이 약 60~70% 대를 유지하면서 스냅드래곤 888보다 훨씬 더 나은 지속 성능을 보여준다.
Mali-G78이 G77과 비교시 큰 폭의 개선이 없이 근본적으로 같은 수의 FPU, 텍스쳐 유닛, ROP를 공유하는 동일한 Valhalla 아키텍처임을 감안하면 전력효율 문제의 해소를 위해서는 결국 현 상황에서는 다이 사이즈의 증가를 감수하여 하이실리콘 처럼 클러스터 수를 늘리는 방향밖에 없을 것이라는 결론이 나온다. 그렇지 않다면 RDNA2 기반 GPU가 나오기 전까지는 전성비 면에서 크게 밀리는 상황이 계속 반복될 것이다.
실제 게이밍 성능 면에서는 865와 비슷하다는 평이 있다. 퀄컴과의 비교시 여전히 한 세대 차이나지만, 삼성 엑시노스 9 시리즈 보다는 더 낫다는 의견이 중론. 정확하게는 GOS를 비활성화 하여 발열과 전력소모의 증가를 감수한다면, 원신 구동시 GPU가 494MHz를 유지하다가 그 이후부터 403MHz로 쓰로틀링이 걸리게 되며, S20+의 스냅드래곤 865보다 더 나은 프레임을 보여준다. 그러나 이러한 과정을 거치지 않고 GOS를 그대로 활성화 시켜두었다면, 기기 온도와 무관하게 GPU 클럭이 312MHz로 제한이 걸리게 되고, 이러한 상황에서는 당연히 저조한 게임 성능을 보여준다.
[ SPEC2006 기준 Cortex-A55 @ 1.80GHz 구동시 전력소모(클릭시 확대) ]
삼성 5nm SF5E 공정 분석을 위하여 Anandtech에서 측정한 모바일 CPU의 SPEC 2006 전력 측정 자료를 참고하였다. 최대한 수평적인 비교를 위하여 동일한 Cortex-A55가 동일한 클럭(1.80 GHz)으로 작동할 때의 전력(Power)을 비교해 봐야 한다. 보통 Cortex-A53이나 Cortex-A55는 공정 자체의 PPA를 검증하는데 자주 사용되기 때문에 본 테스트를 통하여 공정 자체의 전력 대비 성능을 유추할 수 있다.
TSMC N7P와 삼성 SF5E는 저전력 환경에서는 동일 성능, 동일 아키텍처, 동일 클럭 하에서 비교시 SF5E가 Power 측면에서 1~2% 앞서는 수준으로 사실상 오차범위 내에서 동급이었던 것으로 판단이 된다. SF7 = N7 < SF5E = N7P < N5 라는 공식이 성립하는 것이다. TSMC의 N5 공정과 비교시에는 확실한 열세.
일부 중화권 미디어에서는 자체적인 측정치를 가지고 Cortex-A55 @ 1.80 GHz 전력 소모를 측정하여 삼성의 SF5E가 TSMC의 N7P보다도 훨씬 낮은 수준의 효율을 가진다고 호도하는 경우가 있었다. 그러나 이 또한 그대로 수용해서는 안되는게, 중화권 사이트의 측정 자료는 대부분 실측 자료가 아니라 어플리케이션으로 예측한 자료이기 때문에 전력소모 측정 면에서 정확하다고 할 수 없기 때문이다.
이와 더불어 아난드텍의 웹진은 삼성전자 Cortex-A78 vs 퀄컴 Cortex-A77 간의 비교에서 효율 격차가 35% 벌어진다는 자료를 통하여 SF5E가 고클럭 상에서는 N7P보다 효율이 낮을 수 있다고 하였으나, 이는 여러가지의 오류를 내포하고 있다.
일단 첫 번째로 동일 아키텍처가 아니기 때문에 수직적인 비교는 어렵다. 미디어텍의 Dimensity의 예를 보면 동일 클럭상에서 N6 공정으로 양산이 된 Cortex-A78 CPU가 N7 공정으로 양산된 Cortex-A77과 비교시 동일한 전성비를 보여주는데, N6이 N7의 하프노드 개선 공정이라는 점을 감안하면, 실제 A78의 효율은 A77보다도 낮다는 것을 알 수 있다. 순수한 공정간의 비교가 이뤄져야 하는데 한쪽에 아키텍처적으로 디스어드밴티지를 주고 비교하는 것은 어폐가 존재한다. 두 번째로 같은 A78/X1 IP에 + SF5E 공정으로 양산되는 퀄컴 스냅드래곤이 동일한 조건의 삼성의 A78/X1에 비해 더 높은 효율을 내어 준다는 점이다. 따라서 퀄컴 Cortex-A78 vs 퀄컴 Cortex-A77로 비교하면 효율 격차가 위에서 언급한 35%가 아닌 15~20% 내외로 좁혀진다. 삼성보다 퀄컴이 Cortex-A 시리즈 IP를 더 효율적으로 설계하는 상황인 셈이다. 그런데 공정간의 비교에 있어서 서로 다른 설계사의 CPU를 비교하면서 한쪽에만 디스어드밴티지를 주어서 일부러 격차가 큰 것 처럼 부풀리는 것은 확실히 과장된 서술이다. 공정간의 비교를 위해서는 최대한 동일한 조건을 맞추고 외부 요인을 배제하여 비교하여야 한다.
- 결론
엑시노스 2100은 엑시노스 M 시리즈 CPU 코어를 사용했을 때처럼 타사 AP와의 격차가 심각하게 벌어지지는 않았다. 이 때문에 엑시노스 2100이라는 AP 자체가 하나의 변곡점이 될 수 있다는 평이 있지만, 그럼에도 불구하고 AP 자체로만 놓고 봤을때는 그동안의 홍보에 비해서 상당히 실망스럽다는 평이 대다수인 상황이다. 일단 설계 측면에서는 ARM Cortex-A78과 Cortex-X1 자체가 공언했던 것만큼의 성능을 내주지 못하였던 점도 있었으나,[4] 삼성이 ARM 레퍼런스 아키텍처를 활용하는 능력도 예전 Cortex-A57을 세미 커스텀 하던 때 처럼의 폼을 보여주지 못하는 상황이다. 이 때문에 SARC 내의 CPU 커스텀 팀을 해체한 것이 성급한 판단이었다는 지적도 존재한다.[5] 그리고 공정 면에서도 PPA중에 Performance, Power 측면에서 SF5E는 아무리 긍정적으로 가정하여도 결국 N5에는 못미치는 N7P과 동일한 수준이며, Area 측면에서도 1.3배 가량 부족한 밀도 때문에 TSMC제 AP처럼 트랜지스터 수를 획기적으로 늘릴 수 없고, 이 또한 설계 상의 제약으로 존재하는 상황이다. 격차를 줄이는 데는 성공하였으나, 22년에 예정된 RDNA GPU같은 획기적인 게임 체인저가 아니라면 결국 판을 뒤집을 수 없는 상황이라는 것이 중론. 거기다가 사실상 엑시노스의 미래 이미지가 크게 좌우될 수 있는 AP임에도 불구하고 캐시를 절반으로 쳐내는 등의 원가절감 행보나 보이고 있으니 여론은 좋지 않다.[6] 애플의 A14과는 아예 비교 자체가 민망한 상황. 그나마 유일하게 좋은 평가를 내려줄 수 있는 부분이 있다면 NPU가 되겠다. 지금은 뒤쳐졌을지언정 어쨌거나 세대를 거듭하며 가시적인 NPU 성능 향상이 이루어지고 있고, 경쟁사들의 차이가 지속적으로 좁혀지고 있기 때문이다.
[1] 그래서 ARM 측의 공식 홈페이지에서도 삼성이 2100을 기점으로 Cortex-X 의 주요 고객이 되었다고 공개되었다.[2] 구명칭 5LPE, 현명칭 SF5E[3] 단, 링크 내에서는 표본이 3대 뿐이라는 점을 감안하자.[4] ARM 사의 홍보 자료에서 공통적으로 IPC 1.3배를 언급하였으나, 이는 결국 지켜지지 않았다.[5] 하지만 Exynos M5의 상태를 보면 남겨두었다고 큰 도움이 되었을지는 미지수이다. Exynos M5의 최대성능은 Cortex-A78대비 더 떨어지면서도 전력소모량은 풀로드 기준으로 100%나 더 높았다. 물론 만들어진 아키텍처를 커스텀 하는것과 아예 독자적으로 개발하는 것은 난이도에서 차원이 다르긴 하나, 이를 감안해도 전성비 면에서 2년 이상을 답보하며 경쟁 아키텍처와 2배 이상의 차이가 벌어지도록 허용한 것은 그야말로 절망적인 역량이다.[6] 물론 기술적인 관점에서는 경쟁AP대비 불과 절반의 캐시를 가지고도 성능을 비슷하게 맞춘 것 자체는 상당히 고무적이긴 하다.
2.1.2. 엑시노스 2200 / S5E9925[편집]
[ 자세히 보기 ]